import pdfplumber
import pandas as pd
path = r"./data/test2.pdf"

# with pdfplumber.open(path) as pdf:
#     content = ''
#     #len(pdf.pages)为PDF文档页数
#     for i in range(len(pdf.pages)):
#     	#pdf.pages[i] 是读取PDF文档第i+1页
#         page = pdf.pages[i]
#         #page.extract_text()函数即读取文本内容，下面这步是去掉文档最下面的页码
#         page_content = '\n'.join(page.extract_text().split('\n')[:-1])
#         content = content + page_content
#     print(content)

#extract_tables()用法
with pdfplumber.open(path) as pdf:  # 打开pdf文件
    for i in range(len(pdf.pages)):
        page = pdf.pages[i]
        page_table =page.extract_tables()  # 获取pdf文档第一页的所有表格数据
        for row in page_table:
           print('第'+str(i)+'页的表格数据：', row)
